Меню
Публикации
2025
2024
2023
2022
2021
2020
2019
2018
2017
2016
2015
2014
2013
2012
2011
2010
2009
2008
2007
2006
2005
2004
2003
2002
2001
Главный редактор

НИКИФОРОВ
Владимир Олегович
д.т.н., профессор
Партнеры
doi: 10.17586/2226-1494-2025-25-1-68-77
УДК 004.93'1
Метод семантической сегментации данных воздушного лазерного сканирования водоохранных зон
Читать статью полностью

Язык статьи - русский
Ссылка для цитирования:
Аннотация
Ссылка для цитирования:
Сай С.В., Зинкевич А.В. Метод семантической сегментации данных воздушного лазерного сканирования водоохранных зон // Научно-технический вестник информационных технологий, механики и оптики. 2025. Т. 25, № 1. С. 68–77. doi: 10.17586/2226-1494-2025-25-1-68-77
Аннотация
Введение. Выполнена оценка эффективности нейросетевого метода семантической сегментации трехмерных облаков точек, полученных с использованием беспилотного летательного аппарата «Геоскан 401 Лидар». Реализована нейронная сеть, основанная на модели глубокого обучения PointNet++, которая использует метод непосредственной обработки облаков точек. Разработана методика получения и подготовки набора данных с четырьмя классами: земля, растительность, транспортные средства и строительные объекты. Для увеличения точности оценки предложена методика, основанная на аугментации и перераспределении наборов данных. Метод. Модель нейронной сети состоит из иерархически построенных блоков, выполняющих выборку, группировку и извлечение признаков. Изменение количества блоков и задание радиуса поиска локальных признаков влияет на точность сегментации и вычислительные затраты. Основные результаты. Проведена оценка эффективности метода семантической сегментации трехмерных облаков точек, полученных с помощью беспилотного летательного аппарата. Методика аугментации и перераспределения наборов данных позволила улучшить среднее значение Intersection over Union (IoU) не менее, чем на 35 %. Для полученных данных определен оптимальный радиус в слое группировки, при котором обеспечивается баланс между детализацией и чувствительностью. Установлено, что увеличение количества точек в наборе данных не приводит к существенному росту точности, однако разнообразие используемых наборов данных улучшает эффективность подхода. Обсуждение. Разработанный набор данных позволяет повысить эффективность применяемого подхода, в том числе при обучении на иных моделях. Полученные результаты исследования свидетельствуют о перспективности использования предложенных методик и алгоритмов при решении задачи построения цифровых моделей реки Амур и ее основных притоков.
Ключевые слова: лидарная съемка, воздушное лазерное сканирование, облако точек, семантическая сегментация, нейронная сеть PointNet, гидрологические исследования
Благодарности. Исследование выполнено за счет гранта Российского научного фонда № 24-11-20024 и Министерства образования и науки Хабаровского края (cоглашение № 124С/2024).
Список литературы
Благодарности. Исследование выполнено за счет гранта Российского научного фонда № 24-11-20024 и Министерства образования и науки Хабаровского края (cоглашение № 124С/2024).
Список литературы
- Неров И.О., Краснопеев С.М., Бугаец А.Н., Беликов В.В., Глотко А.В., Борисова Н.М., Васильева Е.С., Кролевецкая Ю.В. Опыт создания цифровой модели рельефа для гидродинамических расчетов в бассейне р. Амур // Вестник ДВО РАН. 2021. N 6 (220). С. 45–55. https://doi.org/10.37102/0869-7698_2021_220_06_04
- Behley J., Garbade M., Milioto A., Quenzel J., Behnke S., Stachniss C., Gall J., SemanticKITTI: a dataset for semantic scene understanding of LiDAR sequences // Proc. of the IEEE/CVF International Conference on Computer Vision (ICCV). 2019. P. 9296–9306. https://doi.org/10.1109/iccv.2019.00939
- Angrish A., Bharadwaj A., Starly B. MVCNN++: Computer-Aided design model shape classification and retrieval using multi-view convolutional neural networks // Journal of Computing and Information Science in Engineering. 2021. V. 21. N 1. P. 011001. https://doi.org/10.1115/1.4047486
- Feng Y., Zhang Z., Zhao X., Ji R., Gao Y. GVCNN: group-view convolutional neural networks for 3D shape recognition // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2018. P. 264–272. https://doi.org/10.1109/cvpr.2018.00035
- Li M., Cao Y., Wu H. Three-dimensional reconstruction for highly reflective diffuse object based on online measurement // Optics Communications. 2023. V. 533. P. 129276. https://doi.org/10.1016/j.optcom.2023.129276
- Sfikas K., Pratikakis I., Theoharis T. Ensemble of PANORAMA-based convolutional neural networks for 3D model classification and retrieval // Computers and Graphics. 2018. V. 71. P. 208–218. https://doi.org/10.1016/j.cag.2017.12.001
- Riegler G., Ulusoy A.O., Geiger A. OctNet: learning deep 3D representations at high resolutions // Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. P. 6620–6629. https://doi.org/10.1109/cvpr.2017.701
- Choy C., Gwak J., Savarese S. 4D spatio-temporal ConvNets: Minkowski convolutional neural networks // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). 2019. P. 3070–3079. https://doi.org/10.1109/cvpr.2019.00319
- Hua B.-S., Tran M.-K., Yeung S.-K. Pointwise convolutional neural networks // Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2018. P. 984–993. https://doi.org/10.1109/cvpr.2018.00109
- Li W., Luo Z., Xiao Z., Chen Y., Wang C., Li J. A GCN-Based method for extracting power lines and pylons from airborne LiDAR data // IEEE Transactions on Geoscience and Remote Sensing. 2022. V. 60. P. 1–14. https://doi.org/10.1109/TGRS.2021.3076107
- Wang Y., Sun Y., Liu Z., Sarma S.E., Bronstein M.M., Solomon, J.M. Dynamic graph CNN for learning on point clouds // ACM Transactions on Graphics. 2019. V. 38. N 5. P. 146. https://doi.org/10.1145/3326362
- Liang Z., Yang M., Deng L., Wang C., Wang B. Hierarchical depthwise graph convolutional neural network for 3D semantic segmentation of point clouds // Proc. of the International Conference on Robotics and Automation (ICRA). 2019. P. 8152–8158. https://doi.org/10.1109/ICRA.2019.8794052
- Zhao Y., Zhou F., Guo B., Liu B. Spatial temporal graph convolution with graph structure self-learning for early MCI detection // Proc. of the IEEE 20th International Symposium on Biomedical Imaging (ISBI). 2023. P. 1–5. https://doi.org/10.1109/isbi53787.2023.10230807
- Qi C.R., Su H., Mo K., Guibas L.J. PointNet: deep learning on point sets for 3D classification and segmentation // Proc. of the IEEE conference on computer vision and pattern recognition (CVPR). 2017. P. 1–9. https://doi.org/10.1109/cvpr.2017.16
- Qi C.R., Li, Y, Su H., Guibas L.J. PointNet++: deep hierarchical feature learning on point sets in a metric space // arXiv. 2017. arXiv:1706.02413v1. https://doi.org/10.48550/arXiv.1706.02413
- Varney N., Asari, V.K., Graehling Q. DALES: a large-scale aerial LiDAR data set for semantic segmentation // Proc. of the IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW). 2020. P. 1–10. https://doi.org/10.1109/cvprw50498.2020.00101